期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 一种利用语义相似度改进问答摘要的方法
应文豪, 肖欣延, 李素建, 吕雅娟, 穗志方
北京大学学报自然科学版    2017, 53 (2): 197-203.   DOI: 10.13209/j.0479-8023.2017.028
摘要783)   HTML38)    PDF(pc) (1290KB)(363)    收藏

在搜索引擎中对用户问题直接给出简要的答案(即答案摘要)可以帮助用户更快捷的获取信息。针对这一任务, 设计一种基于特征的答案摘要抽取方法。为了进行句子相似性的计算, 提出通过使用卷积神经网络表示句子语义和计算相似性, 同时给出基于最大间隔学习的网络训练方法。在百度知道问答语料上的实验结果表明, 所提出的答案摘要抽取方法能够生成质量良好的简短回答。与基于词袋的相似性计算相比, 使用卷积神经网络能够更好地描述句子语义, 计算问题和句子之间的相似性, 有效地改善答案摘要的质量。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
2. 基于翻译日志的统计机器翻译模型剪枝
刘凯,吕雅娟,姜文斌,刘群
北京大学学报(自然科学版)   
摘要792)      PDF(pc) (399KB)(373)    收藏
提出一种基于翻译日志的统计机器翻译模型的剪枝方法。该方法利用翻译规则在翻译日志中的命中频数对机器翻译规则进行过滤, 保留当前机器翻译模型所需的最小规则表。实验表明, 该方法能够在仅保留原有模型1%~3%翻译规则的前提下达到原有模型的翻译效果。
相关文章 | 多维度评价 | 评论0
3. 藏文数词识别与翻译
孙萌,华却才让,刘凯,吕雅娟,刘群
北京大学学报(自然科学版)   
摘要838)      PDF(pc) (497KB)(444)    收藏
通过对藏文数词内部构词规律及外部边界信息进行分析, 提出对藏文数词基本构件定义的方案。采取最优路径决策模型判断数词构件边界, 然后通过有限自动机模型识别并翻译基本数词, 最后用模板匹配算法处理复杂数词。结果表明,提出的方法对数词识别与翻译的F值达到98.73%, 在藏汉机器翻译的测试集上的BLEU提高了2.64%。
相关文章 | 多维度评价 | 评论0